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摘 要 : 水 资源 匮乏 是 于 旱 区 实现 可 持续 发 展 的 最 大 障碍 。 干 旱 区 农业 灌溉 耗费 大 量 的 水 资源 ,不 


辣 农作物 在 生长 期 所 需 的 灌溉 水 量 存在 较 大 的 差异 ， 


局 此 快速 准确 地 了 解 干 星 区 的 农业 种 植 结构 


可 以 为 节 水 型 农业 种 植 结构 优化 提供 重要 依据 。 以 天 山北 坡 经 济 带 为 研究 区 ,以 谷歌 地 球 引 擎 
(Google Earth Engine, GEE) 云 平台 为 支撑 ,以 Sentinel-2 以 及 Landsat 7-8 的 数据 为 遥感 数据 源 , 采 
取 以 下 步骤 进行 研究 区 的 农业 种 植 结构 提取 :首先 ,为 了 简化 农业 种 植 结构 提取 的 过 程 , 利 用 一 年 


最 大 NDVI 值 以 及 坡度 信息 构建 耕 ] 


4 掩 膜 图 层 ; 然 后 ,根据 研究 区 内 主要 农作物 的 物候 历 ,获取 不 


同时 间 段 内 的 最 大 NDVI 值 的 时 间 序 列 数据 以 及 农作物 在 一 年 中 出 现 NDVI 最 大 值 的 日 期 ,并 在 此 


基础 上 构建 一 个 包含 10 波段 的 特征 波段 影像 ;最 后 ,结合 野外 实地 考察 获得 的 有 效 样本 点 以 及 经 
耕地 掩 膜 图 层 掩 膜 后 的 10 波段 特征 波段 影像 ,利用 随机 森林 分 类 器 进行 研究 区 的 农业 种 植 结构 提 
取 。 分 类 结果 表明 :2018 年 研究 区 内 棉花 、 玉 米 、 小麦 的 总 体 分 类 精度 为 92. 19% ,Kappa 系数 为 


0.883。 为 了 进一步 将 分 类 结果 与 统计 数据 进行 对 比 , 我 们 将 训练 得 到 的 分 类 器 应 用 于 2017 年 的 
遥感 影像 ,提取 了 研究 区 内 2017 年 的 农业 种 植 结构 信息 ,其 分 类 结果 表明 2017 年 研究 区 内 棉花 、 
玉米 、 小麦 的 种 植 面积 分 别 为 $ 270 km?,2 000 km?^,2 340 km! ,其 相对 精度 分 别 为 86. 5396, 


77.54% 86.19% 。 
关 键 词 : 


农业 种 植 结构 是 农作物 空间 格局 的 主要 组 成 部 
分 , 指 一 个 地 区 或 生产 单位 内 的 农作物 种 植 类 型 及 
其 空间 分 布 ”。 实 时 准确 地 掌握 农业 种 植 结构 的 
动态 变化 信息 ,可 以 为 区 域 农作物 佑 产 、 农 业 种 植 结 
构 调整 及 其 优化 提供 重要 依据 *“。 干旱 区 农业 属 
于 典型 的 灌溉 农业 ,水 资源 匮乏 是 干旱 区 实现 可 持 
续 发 展 的 最 大 障碍 ,因此 快速 .准确 地 了 解 干旱 区 的 
农业 种 植 结构 可 以 为 干旱 区 的 节 水 型 农业 种 植 结构 
优化 提供 重要 依据 。 由 于 利用 人 力 调查 一 个 地 区 或 
生产 单位 内 的 农业 种 植 结构 情况 十 分 耗 时 耗 力 , 近 
些 年 来 遥感 技术 因 其 监测 范围 广 .实时 性 强 以 及 使 
用 成 本 低 等 诸多 优点 ,已 被 广泛 地 应 用 于 对 地 观测 


D WAAR: 2019-01-14; 修订 日 期 : 2019 -04 -22 


农业 遥感 ; 谷歌 地 球 引擎 ; 随机 森林 分 类 ; 


种 植 结 构 提 取 ; 绿洲 农业 


中 ,其 为 快速 和 准确 地 获取 大 范围 的 农业 种 植 结构 
信息 提供 了 新 的 技术 手段 |。 

目前 ,基于 遥感 的 农业 种 植 结构 提取 方法 主要 
利用 农作物 的 光谱 特征 、 时 相 特 征 以 及 空间 特征 , 概 
括 起 来 主要 有 3 大 类 :(1) 基于 单一 影像 的 农业 种 
植 结构 提取 方法 。 该 方法 适用 于 种 植 结构 相 对 单一 
的 地 区 ,通过 找到 不 同 农 作物 的 关键 物候 识别 期 以 
及 农作物 与 其 他 地 类 在 光谱 特征 上 的 差异 进行 农业 
种 植 结构 提取 。 如 MATHUR 等 "使 用 IRS-1D 影像 
(Indian Remote Sensing satellite-1D ) 以 及 棉花 和 水 
稻 的 光谱 特征 ,结合 支持 向 量 机 (SVM ) 分 类 算法 ， 
成 功 提取 了 印度 旁遮普 区 域内 水 称 和 棉花 的 空间 分 
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布 状况 。(2) 基于 时 间 序 列 影像 的 农业 种 植 结构 提 
取 方 法 。 该 方法 充分 利用 农作物 的 季 相 特征 ,根据 
农作物 在 不 同时 期 的 生长 状态 来 进行 农作物 识别 。 
目前 该 方法 已 经 成 为 农业 种 植 结 构 提 取 的 主流 方 
法 。 如 ZHONG 等 ”采用 不 同 植被 指数 (EVI, NDSVI 
等 ) 的 时 序 特征 以 及 累积 积温 (Growing-degree-day， 
GDD ) 等 特征 ,使 用 随机 森林 分 类 算法 成 功 提取 了 
美国 堪萨斯 州 多 尼 芬 县 内 玉米 与 大 豆 的 空间 分 布 状 
况 。(3) 基于 遥感 影像 与 其 他 数据 融合 的 农业 种 植 
结构 提取 方法 。 由 于 遥感 数据 受到 获取 能 力 等 因素 
的 影响 ,往往 不 能 满足 国家 以 及 全 球 尺度 下 的 农业 
种 植 结构 提取 。 因 此 ,许多 学 者 尝试 了 将 遥感 数据 
与 其 他 数据 (如 统计 数据 ) 进行 融合 的 方式 来 实现 
国家 以 及 全 球 尺度 下 的 农业 种 植 结 构 提 取 , 如 
PORTMANN 等 ”通过 结合 灌溉 农作物 和 雨 养 农 作 
物 的 物候 历 .农作物 面积 以 及 地 形 等 信息 进行 重 分 
类 ,成 功 获取 了 全 球 2000 年 5 分 栅 格 尺度 的 26 种 
灌溉 和 两 养 农作物 的 空间 分 布 。 

目前 ,利用 时 间 序 列 影像 进行 大 范围 的 农业 种 
植 结 构 提取 主要 使 用 的 是 低 分 辨 影像 ,如 MODIS 数 
据 , 因 其 覆盖 范围 广 .重复 周期 短 等 优势 被 广泛 地 应 
用 于 大 尺度 (区 域 、 国 家 、 全 球 ) 的 农业 种 植 结构 提 
取 , 但 影像 的 低 分 辨 也 会 导致 大 量 混合 像 元 产生 ,从 
而 降低 农业 种 植 结构 提取 的 精度 '"" 1。 中 高 分 辨 
率 影像 能 减少 混合 像 元 ,但 由 于 其 监测 范围 小 和 重 
返 周期 长 等 因素 限制 了 其 在 大 范围 内 进行 农业 种 植 
结构 提取 的 应 用 。 目 前 ,使 用 中 高 分 辩 率 遥感 影像 
在 干旱 区 进行 大 范围 的 农业 种 植 结 构 提 取 的 研究 较 
少 。 为 解决 大 范围 的 干旱 区 农业 种 植 结构 提取 所 面 
临 的 低 分 辩 率 遥感 影像 混合 像 元 严重 和 中 高 分 辩 率 
遥感 影像 监测 范围 小 以 及 重 返 周期 长 等 问题 ,本 文 
以 天 山北 坡 经 济 带 为 研究 区 ,基于 Google Earth En- 
gine (GEE) 云 平台 ,结合 使 用 中 高 分 辩 率 的 Senti- 
nel-2 和 Landsat 7-8 等 多 源 遥 感 数据 ,通过 构建 ND- 
时间 序列 以 及 其 他 辅助 特征 进行 天 山北 坡 经 济 
带 的 农业 种 植 结构 快速 提取 。 

GEE 云 平台 是 一 个 能 在 大 尺度 范围 下 进行 融 
感 数 据 处 理 以 及 分 析 的 云 平台 ,该 平台 提供 了 一 个 
完备 的 集成 环境 ,其 中 包括 遥感 数据 库 ( 如 Sentinel- 
2A/B „Landsat 系列 .MODIS 等 遥感 数据 ) ,以 及 建立 
在 JavaScript( 或 Python) APIs 上 的 交互 式 算法 开发 
环境 。 目 前 ,国内 外 多 个 研究 组 基于 该 平台 开展 
了 各 种 对 地 观测 研究 ,如 水 稻 遥 感 制图 捕 ; ,耕地 遥 


感 提取 ' ,城市 变化 遥感 检测 5 ,冬小麦 遥感 制 
图 59 等 


1 研究 区 概况 与 数据 源 


1.1 研究 区 概况 

天 山北 坡 经 济 带 地 处 亚 欧 大 陆 腹地 ,位 于 天 山 
AGRE 准噶尔 盆地 南 缘 , 属 于 干旱 与 半 干 旱 气 候 区 ， 
地 理 范 围 为 79"52' ~91°32'E 43°01’ -46?13'N, 该 
区 域 以 乌鲁木齐 市 为 中 心 , 东 起 木 垒 哈萨克 自治 县 ， 
西 至 温泉 县 , 横 跨 17 个 县 市 (图 1) 。 近 十 几 年 
来 ,该 地 区 每 年 的 国内 生产 总 值 占 新 疆 维吾尔 自治 
区 国内 生产 总 值 的 50% 左右 ,是 新 疆 经 济 教育、 科 
技 等 最 为 发 达 的 地 区 ,也 是 丝绸 之 路 经 济 带 通 往 中 
亚 和 欧洲 的 重要 枢纽 所  。 但 由 于 受 干 旱 气候 环 
境 的 影响 ,水 资源 匮乏 已 成 为 制约 该 地 区 实现 可 持 
续 发 展 的 最 大 因素 ,而 该 地 区 的 农业 耗 水 占 该 地 
区 总 耗 水 的 91% |。 因此 ,深入 了 解 该 地 区 的 农 
业 种 植 结构 ,有 利于 该 地 区 的 水 资源 优化 配置 以 及 
可 持续 发 展 。 根 据 历年 的 《新疆 统 计 年 鉴 》 可 知 ,该 
地 区 主要 种 植 的 农作物 为 棉花 、 玉 米 以 及 小 麦 等 一 
年 一 熟 的 农作物 ,2017 年 这 3 类 农作物 的 种 植 面 积 
占 整 个 地 区 农作物 种 植 面积 的 76.9% 7, 
1.2 数据 源 
1.2.1 交感 数据 多 时 相 的 遥感 数据 能 够 充分 地 
反映 农作物 的 生长 特征 '>-* ,本 文 根 据 不 同 农作物 
在 不 同时 期 的 生长 状况 信息 ( 表 1) 来 进行 研究 区 的 
农业 种 植 结构 提取 。 为 了 充分 获取 研究 区 内 不 同 农 
作物 在 不 同时 期 的 生长 状况 信息 ,在 农作物 种 植 结 
构 提 取 的 识别 期 内 ,我 们 在 GEE 云 平台 上 一 共 获 得 
了 4 313 景 遥 感 影像 ,其 中 Sentinel-2 影像 3 582 景 ， 
Landsat-8 影像 381 景 ,Landsat-7 影像 350 景 ( 表 2)。 
综合 以 上 多 源 遥 感 影像 一 方面 可 以 增加 可 用 的 遥感 
数据 (光学 遥感 影像 往往 容易 受到 云 的 干扰 使 得 可 
用 像 元 减少 ) 。 另 一 方面 ,由 于 各 卫星 过 境 时 间 不 
同 , 融 合 使 用 多 源 遥 感 数据 可 以 提高 遥感 监测 时 间 
频率 以 更 好 地 捕捉 农作物 的 生长 过 程 ( 如 Landsat-8 
1r 2018 年 3 月 在 新 疆 过 境 的 时 间 分 别 为 3 月 7 日 
与 3 月 23 日 ,而 Landsat-7 在 2018 年 3 月 份 在 新 疆 
过 境 的 时 间 分 别 为 3 月 15 日 与 3 月 31 日 )。 
1.2.2 地 面 调查 数据 ”我们 于 2018 年 5~6 月 在 
研究 区 内 进行 了 野外 实地 考察 ,一 共 记 录 了 有 效 
样本 点 822 个 。 其 中 ,棉花 有 效 样本 点 394 个 ,玉米 
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Fig. 1 


Location of the study area and the spatial distribution of the samples 


表 1 研究 区 内 主要 农作物 的 物候 历 


Tab.1 Crops calendars in study area 


表 2 实验 选取 的 遥 居 


影像 源 


Tab.2 Remote sensing data sources used in this study 


传感器 类 型 获取 时 间 波段 波段 名 称 ”波长 /om 分辨 率 /m 数据 源 
Sentinel -2 MSI,TOA 2018 -03 -01 一 2018 -12 -01 B4 Red 665 10 ESA 
B8A NIR 842 10 
Landsat 8 OLI, TOA 2018 -03 -01—2018 - 12 - 01 B4 Red 640 ~ 670 30 USGS 
B5 NIR 850 ~ 880 30 
Landsat7 ETM + ,TOA 2018 -03 -01—2018 - 12 - 01 B3 Red 630 ~ 690 30 USGS 
B4 NIR 770 ~ 900 30 
Shuttle Radar Topography Mission ( SRTM) Slope 30 USGS 
有 效 样本 点 220 个 ,小 麦 有 效 样本 点 67 个 ,葡萄 有 EERE) 的 种 植 面积 ,并 将 其 作为 评价 标 
效 样本 点 51 个 e JUE ME, oup eR HL e ER I IRR REITS 
瓜 等 ) 有 效 样本 点 90 个 。 在 进行 地 面 采样 的 过 程 。 上 度 评价 。 
中 A , 即 样本 点 1.3 ”数据 预 处 理 
之 间 均 为 独立 的 单个 像 元 ,以 增强 分 类 的 可 靠 性 ,有 云 以 及 云 阴影 对 光学 遥感 影像 具有 显著 的 影 
效 样本 点 在 研究 区 内 的 空间 分 布 如 图 1 所 示 。 wj ,它们 会 严重 影响 基于 遥感 影像 所 进行 的 研 


1.2.3 统计 数据 ”根据 最 新 的 《新 疆 统计 年 鉴 》 
(2017 4E) ,我 们 统计 了 该 区 域内 各 主要 农作物 ( 棉 


究 ,如 :遥感 影像 合成 ” .植被 指数 计算 以 及 地 
REBAR 等 。 我 们 在 CEE 云 平台 上 采用 了 
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FMASK'” 算 法 对 获取 的 遥感 数据 进行 了 去 云 以 及 
去 云 阴 影 处 理 , 以 减少 数据 合成 ,植被 指数 计算 等 对 
农业 种 植 结构 提取 所 造成 的 噪声 影响 。 同 时 将 Sen- 
tinel-2 的 数据 产品 (10 m) 重 采样 至 Landsat 7-8 的 
30 m 分 辨 率 ,以 保证 使 用 的 遥感 数据 在 分 辨 率 上 的 
一 致 。 


2 研究 方法 


2.3 ”耕地 掩 膜 图 层 构 建 

为 了 减少 非 农作物 植被 对 农业 种 植 结构 提 取 的 
影响 ,我 们 通过 以 下 步骤 提取 了 研究 区 2018 年 的 耕 
地 掩 膜 图 层 :首先 ,我 们 根据 Google Earth 的 高 清 影 
像 以 及 实地 调研 情况 ,在 研究 区 内 选择 了 大 量 的 非 
农作物 植被 样本 点 ,如 森林 、 天 然 草 地 等 ,将 收集 到 
的 非 农作物 植被 样本 点 与 有 效 的 农作物 样本 点 在 各 
类 通 感 数据 (如 :NDVI.DEM 等 数据 产品 ) 上 进行 分 
析 对 比 ;其 次 ,根据 分 析 对 比 的 结果 以 及 以 往 的 研 
究 ,构建 耕地 掩 膜 判 别 规则 : NDVI, > 0. 40" 和 
Slope <7°。 其 中 NDVI 代表 一 年 中 最 大 的 NDVI 
ii Slope 代表 坡度 信息 ,由 SRTM 数据 计算 所 得 ;最 
后 ,以 Landsat-8 的 遥感 数据 以 及 SRTM 数据 为 数据 
源 , 根 据 构建 的 规则 提取 耕地 掩 膜 图 层 , 并 将 获得 的 
耕地 掩 膜 图 层 与 Google Earth 的 高 清 影 像 进行 从 
加 ,通过 人 工 目 视 解 译 去 除 一 些 明 显 提取 错误 的 区 
域 ,最 终 获 得 研究 区 2018 年 30 m 分 辨 率 的 耕地 掩 
膜 图 层 ( 图 2)。 为 了 检验 耕地 提取 的 精度 ,我 们 在 
生成 的 耕地 掩 膜 图 层 中 随机 生成 1 000 个 样本 点 ， 


并 利用 Google Earth 的 高 清 影像 对 生成 的 样本 点 进 
行人 工 目 视 解 译 以 判断 其 是 否 属于 耕地 。 结 果 表明 
在 这 1 000 个 随机 样本 点 中 有 967 个 为 耕地 样本 
点 ,33 个 为 非 耕 地 样本 点 (其 中 多 为 防护 林 以 及 其 
他 自然 植被 ) ,耕地 提取 的 精度 为 96.7% ,可 以 满足 
下 一 步 的 要 求 。 

2.2 农作物 分 类 特征 构建 

2.2.1 NDVI 时 序 将 征 构 建 ” 植 被 指数 常常 被 作 
为 特征 参数 来 评估 地 表 植 被 的 生长 状况 ,其 中 归 一 
化 植被 指数 (Normalized Difference Vegetation Index , 
NDVI) 使 用 最 为 广泛 ””。NDVI 表达 了 红 波 段 
(植物 吸收 强烈 ) 与 近 红 外 波段 (植被 反射 强烈 ) 之 
间 的 关系 ,其 计算 公式 如 下 所 示 ” : 


CNIR ~ PRea 
Pnr 十 DRed 
式 中 :pa 代表 近 红 外 波段 的 反射 率 ;pna 代 表 红 波段 
的 反射 率 。 由 于 ND 能 够 很 好 地 反映 植被 的 生长 
状况 ,因此 本 文 将 NDVI 作为 评估 农作物 在 不 同时 
期 生长 状况 的 主要 特征 参数 。 

不 同 传感器 在 设计 上 的 差异 ,导致 了 不 同 传 感 
器 具有 不 同 的 光谱 响应 函数 (Spectral Response 
Functions, SRF) 。 比 如 ,Sentinel-2 与 Landsat-7 的 数 
据 在 红 波 段 的 均 方 根 误差 (Root Mean Square Error, 
RMSE) 超 过 了 8% 5 。 为 了 减 小 由 于 不 同 传感器 
的 不 同 光 谱 响 应 函数 所 带 来 的 误差 ,我 们 以 Land- 
sat-8 数据 计算 的 NDVI 值 为 基准 ,将 Sentinel-2 以 及 
Landsat -7 数据 计算 所 得 的 NDVI 值 进行 相关 的 线性 


NDVI = (1) 
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图 2 研究 区 的 耕地 提取 结果 


Fig.2 Extracted cropland in the study area 
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转换 。 其 采用 的 线性 模型 计算 公式 如 下 所 示 ”) : 
NDVI aus =0.023 540.972 3 x NDVI a2 (2) 
NDVI uus = 70.0046 1.0183 x NDVIua, (3) 


根据 研究 区 内 主要 农作物 的 物候 识别 期 ( 表 
1) ,我 们 利用 去 云 后 的 Sentinel-2 以 及 Landsat 7-8 
数据 计算 了 2018 年 3 月 1 日 ~2018 年 12 月 1 日 这 
个 时 间 段 内 的 所 有 NDVI 值 ,同时 根据 以 上 的 线性 
模型 进行 了 NDVI 值 的 转换 ,并 依据 获取 影像 的 时 
间 对 NDVI 数据 进行 时 间 排 序 。 与 此 同时 ,我 们 对 
排 好 序 的 NDVI 时 间 序 列 ,计算 2018 年 3 月 1 日 ~ 
2018 年 12 H1 日 这 个 时 间 段 内 每 个 月 的 最 大 NDVI 
值 ,并 将 每 个 月 的 最 大 NDVI 值 作为 一 个 特征 波段 。 
2.2.2 辅助 特征 构建 ”通过 对 研究 区 内 不 同 农 作 
物 的 物候 历 进行 深入 分 析 后 ,我 们 发 现 不 同 农 作物 
出 现 生长 峰值 的 时 间 是 有 差异 的 。 比 如 棉花 出 现 
NDVI 最 大 值 的 日 期 在 每 年 的 第 225 d 左右 ,玉米 出 
现 NDVI 最 大 值 的 日 期 在 每 年 的 第 195 d 左右 ,小 麦 
出 现 NDV 最 大 值 的 日 期 在 每 年 的 第 155 d 左右 (图 
3a)。 为 了 更 加 突出 不 同 农 作物 在 不 同时 期 的 生长 
状况 ,我 们 将 农作物 在 一 年 中 获得 NDVI 最 大 值 的 
日 期 也 作为 分 类 特征 参数 。 为 了 扩大 最 大 NDVI 值 
与 出 现 最 大 NDVI 值 日 期 的 差异 ,我们 采用 以 下 公 
式 将 其 进行 归 一 化 处 理 : 


SUM gay — Max, 


(4) 


Normalize. Date = 
SUM jay 


式 中 :Sum 代 表 该 年 一 共有 多 少 天 ，Maxuv 代 表 一 
年 中 出 现 NDVI 最 大 值 的 日 期 。 如 小 麦 NDVI 出 现 
最 大 值 的 日 期 约 为 第 155 d(5 月 份 左右 ) ,其 Nor- 
malize_Date 值 则 为 0.57 ,而 棉花 NDVI 出 现 最 大 值 
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的 日 期 约 为 第 255 d(7 月 份 左右 ) ,其 Normalize_ 
Date 值 则 为 0. 3, 既 NDVI 最 大 值 出 现 的 越 早 ,其 
Normalize. Date 值 武大 。 

根据 2. 2. 1 获得 的 NDVI 时 相 特征 以 及 NDVI 
最 大 值 日 期 特征 ,我 们 一 共 获 取 了 10 个 分 类 特征 量 
(Fl :Max NDVI,,; F2: Max NDVI,,.; F3: Max_ND- 
Vl4,,; FA:Max NDVI,,,; F5:Max NDVI,,; FO: Max_ 
NDVI,,,; F7: Max. .NDVI,,; F8: Max. NDVI,,; F9: 
Max, NDVI,,.; Fl0:Normalize Date) 。 研 究 区 内 主要 
农作物 的 分 类 特征 曲线 如 图 3b 所 示 。 
2.3 随机 森林 分 类 器 

随机 森林 分 类 (Random Forest, RF ) 是 一 种 集成 
学 习 分 类 器 ,是 由 一 系列 CART 决策 树 以 及 投票 机 
制 组 合 而 成 的 机 器 学 习 算 法 。 它 比 其 他 分 类 器 
在 进行 遥感 图 像 分 类 时 表现 得 更 加 健壮 ,分 类 速度 
相对 更 快 ,更 容易 实现 “] 。 它 使 用 bootstrap 抽样 技 
术 从 原始 数据 集中 抽取 训练 集 ,并 通过 训练 集 构建 
CART 决策 树 。 在 构建 CART 决策 树 的 过 程 中 , 同 
时 采取 一 些 规则 (如 Gini 系数 最 小 原则 ) 来 计算 最 
佳 分 割 方式 并 进行 内 部 节点 分 割 ,以 便 减 少 CART 
决策 树 之 间 的 相关 性 ,减少 过 拟 合 现象 。 

我 们 将 在 GEE 云 平台 上 集成 的 随机 森林 算法 
应 用 于 本 文 的 研究 。GEE 云 平台 上 的 随机 森林 
分 类 器 的 参数 如 下 所 述 :(1) 随机 森林 分 类 器 的 决 
策 树 数 量 ;(2) 候选 特征 子 集 ;(3) 叶 节 点 最 小 样本 
数 ;(4) 再 抽样 比率 ; (5) 是 否 计 算 袋 外 错误 率 
(out-of-bag,OOB) ; (6) 随机 种 子 数 。 其 中 随机 森 
林 分 类 带 的 决策 树 数 量 \ 候 选 特征 子 集 以 及 叶 节 点 
最 小 样本 数 是 影响 随机 森林 分 类 器 性 能 与 效率 的 最 
主要 参数 ,我 们 根据 已 有 的 大 量 研究 "以 及 本 
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图 3 研究 区 内 主要 农作物 的 NDVI 值 以 及 分 类 特征 值 变 化 曲线 


Fig.3  Time-series of NDVI and classification variables of major crops in the study area 
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文 研究 的 实际 情况 ,将 以 下 3 个 参数 分 别 设置 为 : 随 
机 森林 分 类 器 的 决策 树 数量 = 100 ;候选 特征 子 集 = 
4; 叶 节点 最 小 样本 数 =1。 根 据 在 2.2 中 构建 的 分 
类 特征 ,在 GEE 云 平 台 上 融合 生成 了 10 波段 的 分 
类 特征 影像 ,并 将 野外 实地 考察 获得 的 有 效 样本 点 
随机 选择 一 半 作 为 训练 集 进 行 随机 森林 分 类 器 的 训 
练 , 男 一 半 作 为 测试 集 验 证 其 分 类 精度 。 


3 分 析 与 讨论 


3.1 精度 分 析 

本 文采 用 混 消 矩阵 精度 以 及 与 统计 数据 对 比 这 
两 种 方式 对 分 类 结果 进行 精度 验证 。 由 于 随机 和 森林 
分 类 需 是 基于 像 元 的 分 类 需 , 分 类 结果 中 往往 存在 
椒盐 噪声 。 在 进行 混 消 矩阵 计算 之 前 ,我 们 采用 众 
数 滤波 (3 x3 pixels) 对 分 类 结果 进行 滤波 处 理 。 最 
终 用 计算 得 到 的 用 户 精 度 (user’s accuracy, UA) Æ 
产 者 精度 (produce's accuracy, PA) ,总体 精度 (over- 
all accuracy, OA) 以 及 Kappa 系数 来 表征 分 类 结果 
的 混 涌 矩 阵 精度 ( 表 3) WR 3 所 示 , 分 类 结果 的 
总 体 精度 为 92. 1996 , Kappa 系数 为 0. 883, 主要 农 
作物 的 用 户 精 度 以 及 生产 者 精度 都 超过 了 85% ,但 
其 他 农作物 的 用 户 精 度 只 有 64. 44% 。 表 明 其 他 农 
作物 (薄板 . 打 瓜 葵花 等 ) 也 具有 与 棉花 、 玉 米 等 作 
物 相似 的 分 类 特征 值 ,特别 是 易于 与 玉米 混淆 。 

由 于 我 们 提取 的 是 研究 区 内 2018 年 主要 农 作 
物 的 种 植 结 构 信 息 , 而 目前 对 于 研究 区 内 的 农业 种 
植 结构 信息 只 统计 到 了 2017 年 ,因此 我 们 将 2018 
年 农业 种 植 结构 提 取 所 训练 的 模型 应 用 于 2017 年 
研究 区 内 的 农业 种 植 结构 提取 ,以 便 与 2017 年 的 统 
计数 据 进行 比较 。 据 统计 ,2017 年 研究 区 内 棉花 、 
玉米 .小麦 的 种 植 面积 分 别 为 4650 km? 、1 630 km? , 
2 050 km’ , 


根据 2017 年 的 分 类 结果 得 知 ,2017 年 研究 区 
内 棉花 、 玉 米 、 小 麦 的 种 植 面积 分 别 为 5 270 km , 
2 000 km? 2 340 km? ,其 分 类 精度 分 别 为 86. 53% 、 
77.54% .86. 19% 。 同 时 我 们 还 统计 了 各 县 市 的 农 
作物 分 类 结果 ,并 与 统计 数据 进行 了 对 比 ( 图 4)。 
由 于 五 家 汇市 与 石河 子 市 属于 新 疆 生 产 建 设 兵团 地 
区 ,统计 年 鉴 中 缺少 这 两 个 地 区 的 农业 种 植 结 构 统 
计 信 息 , 因 此 本 文 没有 对 这 两 个 地 区 的 分 类 结果 进 
行 精度 分 析 。 由 图 4 可 知 ,乌鲁木齐 市 克拉玛依 
.昌吉 回族 自治 州 这 3 个 地 区 的 分 类 结果 较 统计 
数据 而 言 有 较 大 的 误差 ,其 主要 原因 是 这 3 个 地 区 
的 种 植 结构 相对 于 其 他 地 区 更 为 复杂 ,导致 了 其 他 
农作物 与 这 3 类 主要 农作物 产生 了 混淆 。 但 由 于 
2017 年 农业 种 植 结 构 提取 模型 是 基于 2018 年 的 野 
外 实地 考察 数据 训练 获得 的 ,而 不 同年 份 之 间 的 农 
业 种 植 制 度 是 有 所 差异 的 ,因此 更 加 准确 的 精度 验 
证 结果 仍 需 新 的 统计 数据 (2018 年 ) 加 以 论证 。 
3.2 ”种植 结构 提取 结果 
本 文 利用 随机 森林 分 类 器 以 及 构建 的 分 类 特 
征 , 成 功 获 取 了 研究 区 内 2018 年 30 m 分 辩 率 的 农 
业 种 植 结构 信息 (图 5)。 研 究 区 内 棉花 种 植 主要 分 
布 在 精 河 县 . 博 乐 县 `. 乌 苏 市 克拉玛依 市 .奎屯 市 、 
沙 湾 县 石河 子 市 . 玛 纳 斯 县 . 呼 图 壁 县 五 家 渠 市 等 
10 个 地 区 ;玉米 种 植 主要 分 布 在 温 果 县 、 博 乐 市 、 呼 
ABE BET ELBE FARBER KE ARH KA 
县 等 8 4H X RAE EA A BIB 
市 SEIS EET SS ON TH it RAE 6 T HEC ; 8j 
萄 种 植 主要 分 布 在 乌鲁木齐 市 LE vp LIRE P REEL 
玛 纳 斯 县 等 4 个 地 区 。 同 时 我 们 将 遥感 反 演 的 主要 
农作物 的 空间 分 布 信息 与 历年 4 新疆 统计 年 鉴 》 中 
各 地 区 的 种 植 结构 信息 以 及 实地 考察 信息 进行 对 比 
后 发 现 , 遥 感 反 演 的 主要 农作物 的 空间 分 布 能 较 好 


表 3 分 类 精度 
Tab.3 Accuracy of the classification result 

分 类 后 数据 RON 总 计 用 户 精度 

类 后 p RATT HJ 

棉花 玉米 小 麦 葡萄 其 他 农作物 

棉花 190 5 0 2 0 197 96.44% 
玉米 2 106 0 0 2 110 96.39% 
小 麦 1 2 29 0 1 33 87.8796 
葡萄 1 0 0 24 0 25 96. 0096 
其 他 农作物 4 10 1 1 29 45 64.44% 
总 计 198 123 30 27 32 总 体 精度 =92. 19% 
生产 者 精度 95.95% 86.17% 96. 66% 88.89% 90. 62% Kappa 系数 =0. 883 
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乌鲁木齐 市 年 鉴 统 计 
5.80 


乌鲁木齐 市 分 类 统计 


吉 回 族 自治 州 年 鉴 统计 


沙 湾 县 分 类 统计 沙 湾 县 年 鉴 统计 
21971 222 98.50 
186.00 NR 


1 627.19 


博 尔 塔 蒙 古 自治 州 分 类 统计 


图 4 2017 年 农作物 分 类 结 映 


Fig.4 Comparison between classification results and statistical reports in 2017 


的 与 之 相对 应 。 

虽然 根据 遥感 分 类 的 结果 来 看 ,运用 随机 森林 
分 类 器 以 及 构建 的 分 类 特征 能 较 好 的 应 用 于 研究 区 
的 农业 种 植 结构 提取 ,但 是 仍 有 以 下 问题 需要 进 一 
步 分 析 : 由 于 天 山北 坡 经 济 带 主要 从 事 的 是 1 年 1 
季 的 农业 生产 且 种 植 结构 较为 单一 ,因此 ,本 文 并 未 
考虑 多 季 、 套 种 间 种 等 农业 种 植 模式 ;从 遥感 分 类 
结果 来 看 ,棉花 .玉米 .小 麦 是 研究 区 的 主要 农作物 ， 
这 一 点 与 统计 年 鉴 的 统计 信息 是 基本 吻合 的 。 但 由 
PED (GR SEES) HALA Sik 3 类 主要 农 
作物 相似 的 季 相 节律 ,导致 了 遥感 提取 的 这 3 类 农 
作物 的 种 植 面积 大 于 实际 的 种 植 面 积 ,因此 在 后 续 
的 研究 中 需要 更 加 深入 地 了 解 该 地 区 各 个 农作物 在 


1 120.50 


克拉 玛 依 市 分 类 统计 克拉 玛 依 市 年 鉴 统 计 
10.58 0.80 
53.72 \ 35.60 
178.25 90.10 
乌 苏 市 分 类 统计 乌 苏 市 年 鉴 统计 
155.84 88.70 
151.30 


1071.98 
1107.40 


奎屯 市 分 类 统计 
29.45 


奎屯 市 年 鉴 统计 


博 尔 塔 蒙古 自治 州 年 鉴 统计 
103.10 


与 统计 年 鉴 数据 的 比较 


其 他 特征 (空间 特征 等 ) 上 表现 出 来 的 差异 ,以 便 提 
高 分 类 的 精度 。 
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受制 于 有 限 的 水 资源 ,农业 种 植 结构 优化 以 及 
采用 节 水 型 农业 灌溉 技术 是 现代 干旱 区 绿洲 农业 实 
现 可 持续 发 展 的 必 经 之 路 。 本 文 以 天 山北 坡 经 济 带 
为 研究 区 ,通过 利用 研究 区 内 主要 农作物 的 物候 万 
言 息 以 及 野外 考察 数据 ,基于 遥感 数据 构建 了 10 个 
分 类 特征 。 同 时 基于 GEE 云 平台 融合 生成 了 研究 
区 内 Sentinel-2 Landsat 7-8 的 NDVI 时序 数据 以 及 1 
年 中 出 现 NDV/ 最 大 值 的 日 期 数据 ,并 在 此 基础 上 
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Fig.5 Spatial distribution of major crops in the study area in 2018 


构建 了 10 波段 的 特征 波段 影像 。 同 时 通过 野外 考 
察 获 得 的 有 效 样 本 点 以 及 随机 森林 分 类 器 进行 了 人 研 
究 区 内 2018 年 主要 农作物 (棉花 、 玉 米 、 小 麦 ) 的 种 
植 结构 提取 。 根 据 对 其 分 类 结果 进行 分 析 后 ,我 们 
得 出 以 下 主要 结论 : 

(1) 多 源 数据 的 融合 使 用 能 更 加 准确 的 表征 不 
同 农作物 在 不 同时 期 的 生长 状态 。 由 于 我 们 综合 
用 了 Sentinel-2 以 及 Landsat 7-8 作为 遥感 数据 源 , 
因此 能 更 为 准确 地 获取 不 同 农 作物 在 不 同时 期 的 生 
长 状况 以 及 1 年 中 出 现 NDVI 最 大 值 的 日 期 ,同时 
构建 的 最 大 NDVI 值 特征 又 能 够 有 效 的 去 除 薄 云 及 
其 阴影 对 种 植 结构 提取 的 影响 。 

(2) 构建 的 10 个 分 类 特征 以 及 随机 森林 分 类 
器 能 够 较 好 的 适应 于 研究 区 内 的 种 植 结 构 提 取 。 运 
用 构建 的 分 类 特征 以 及 随机 森林 分 类 器 进行 种 植 结 
构 提 取 的 总 体 精度 达到 了 92. 19% , Kappa 系数 为 
0.883, 与 统计 数据 对 比 也 说 明了 构建 的 10 个 分 类 
特征 以 及 随机 森林 分 类 器 能 够 较 好 的 适应 于 该 研究 
区 的 种 植 结构 提取 。 

(3) 天 山北 坡 经 济 带 内 主要 种 植 的 农作物 为 棉 
FE BAK 小麦 ,这 3 种 农作物 的 播种 面积 占 整个 研 
究 区 农作物 播种 面积 的 75% 左右 。 同 时 ,新 的 对 地 
观测 卫星 如 Sentinel-2 星座 以 及 遥感 云 平 台 如 CEE 


的 出 现 ,为 进行 基于 时 间 序 列 影 像 的 大 区 域 农 业 种 
植 结构 快速 提取 带 来 了 新 的 技术 手段 。 
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Cropping structure extraction with NDVI time-series images in 
the northern Tianshan Economic Belt 


XIONG Yuan-kang ^, ZHANG Qing-ling'^ 
(1 Research Center on Ecology and Environment of Central Asia , Xinjiang Institute of Ecology and Geography , Chinese Academy 
of Sciences , Urumqi 830011 ,Xinjiang , China; 2 University of Chinese Academy of Sciences , Beijing 100049 , China; 


3 School of Aeronautics and Astronautics , Sun. Yat-sen University , Guangzhou 510006 , Guangdong , China ) 


Abstract: Limited water resources is the major factor affecting sustainable development in arid areas , and the wa- 
ter resources in arid areas are mostly used for agricultural irrigation. Rapidly and accurately mapping cropping struc- 
ture in arid areas can provide an important basis for optimizing water use in agriculture. In this study ,the Northern 
Tianshan Economic Belt, Xinjiang, China was chosen as the study area, and a method to map the cropping structure 
in this region with multi-source remote sensing data based on the Google Earth Engine ( GEE) cloud platform was 
proposed. The Sentinel-2 and Landsat 7 —8 data were chosen as the remote sensing data sources to extract the crop- 
ping structure in the study area through the following steps. First ,in order to simplify the cropping structure extrac- 
tion process and minimize the impacts from non-crop vegetation ,a cropland mask was constructed by using the max- 
imum NDVI value and slope information throughout the year in the study area. Second, according to the phenology 
calendars of the main crops in the study area ,the time-series data of the maximum NDVI value and the correspond- 
ing date was calculated with remote sensing data. Then ,the 10 feature bands were constructed. Third ,the 10 feature 
bands were masked with the cropland mask. Based on these data together with the field samples ,the random forest 
classifier was applied to cropping structure extraction. The accuracy evaluation results showed the overall accuracy of 
the classification results in 2018 was 92.19% , and the Kappa coefficient was 0. 883. In order to further verify the 
accuracy of the classification algorithm ,the crop structure in the study area in 2017 was also extracted , the classifi- 
cation results showed that the planted area of cotton , corn and wheat in the study area were 5 270 km ,2 000 km” 
and 2 340 km? respectively in 2017 , and then compared it with the results of statistical yearbook data in 2017. The 
relative accuracy of cotton, corn and wheat planted area were 86. 5396 ,77. 5496 and 86.19% , respectively. 

Key words: remote sensing in agriculture; Google Earth Engine ; random forest classification ; crop structure ex- 


traction; oasis agriculture 


